单语语料库:只包含一种语言材料的语料库(Corpus),通常用于语言研究、词典编纂、自然语言处理(NLP)等,例如用大量英文文本构建的英语语料库。(也存在双语/多语语料库等其他类型。)
/ˌmɒnəˈlɪŋɡwəl ˈkɔːrpəs/
A monolingual corpus can help you study common collocations.
单语语料库可以帮助你研究常见的词语搭配。
Researchers built a large monolingual corpus of news articles to train a language model and evaluate word frequency changes over time.
研究人员构建了一个大型新闻单语语料库,用来训练语言模型,并评估词频随时间的变化。
monolingual 由 **mono-**(“单一”)+ lingual(“语言的”,源自拉丁语 lingua “舌头/语言”)构成,字面意思是“单一语言的”。
corpus 源自拉丁语 corpus(“身体”),在语言学中引申为“(文本/语言材料的)集合体”,即“语料库”。